Spark

  • Java
    11-10 06:00
    本课程从实时数据产生和流向的各个环节出发,通过集成主流的分布式日志收集框架Flume、分布式消息队列Kafka、分布式列式数据库HBase、及当前非常火爆的Spark Streaming打造实时流处理项目实战,让你掌握实时处理的整套处理流程,达到大数据中级研发工程师的水平! 课程目录 ├──第1章 课程介绍 | ├──1-1 -导学-.mp4 8.97M | ├──1-2 -授课习惯和学习建议.mp4 15.60M | ├──1-3 -OOTB环境使用演示.mp4 6.99M | ├──1-4 -Linux环境及软件版本介绍.mp4 17.01M | └──1-5 -Spark版本升级.mp4 9.98M ├──第2章 初识实时流处理 | ├──2-1 -课程目录.mp4 1.25M | ├──2-2 -业务现状分析.mp4 7.46M | ├──2-3 -实时流处理产生背景.mp4 2.07M | ├──2-4 -实时流处理概述.mp4 1.80M | ├──2-5 -离线计算和实时计算对比.mp4 3.25M | ├──2-6 -实时流处理框架对比.mp4 9.82M | ├──2-7 -实时流处理架构及技术选型.mp4 4.03M | └──2-8 -实时流处理在企业中的应用.mp4 2.88M ├──第3章 分布式日志收集框架Flume | ├──3-1 -课程目录.mp4 1.33M | ├──3-2 -业务现状分析.mp4 8.64M | ├──3-3 -Flume概述.mp4 23.53M | ├──3-4 -Flume架构及核心组件.mp4 42.38M | ├──3-5 -Flume&JDK环境部署.mp4 26.36M | ├──3-6 -Flume实战案例一.mp4 51.99M | ├──3-7 -Flume实战案例二.mp4 27.93M | └──3-8 -Flume实战案例三(重点掌握).mp4 53.46M ├──第4章 分布式发布订阅消息系统Kafka | ├──4-1 -课程目录.mp4 1.16M | ├──4-10 -Kafka Consumer Java API编程.mp4 47.58M | ├──4-11 -Kafka实战之整合Flume和Kafka完成实时数据采集.mp4 51.00M | ├──4-2 -Kafka概述.mp4 14.40M | ├──4-3 -Kafka架构及核心概念.mp4 8.29M | ├──4-4 -Kafka单节点单Broker部署之Zookeeper安装.mp4 13.76M | ├──4-5 -Kafka单节点单broker的部署及使用.mp4 55.80M | ├──4-6 -Kafka单节点多broker部署及使用.mp4 39.44M | ├──4-7 -Kafka容错性测试.mp4 17.39M | ├──4-8 -使用IDEA+Maven构建开发环境.mp4 13.74M | └──4-9 -Kafka Producer Java API编程.mp4 50.20M ├──第5章 实战环境搭建 | ├──5-1 -课程目录.mp4 886.56kb | ├──5-2 -Scala安装.mp4 7.61M | ├──5-3 -Maven安装.mp4 15.88M | ├──5-4 -Hadoop环境搭建.mp4 40.34M | ├──5-5 -HBase安装.mp4 44.91M | ├──5-6 -Spark环境搭建.mp4 17.39M | └──5-7 -开发环境搭建.mp4 37.55M ├──第6章 Spark Streaming入门 | ├──6-1 -课程目录.mp4 982.94kb | ├──6-2 -Spark Streaming概述.mp4 18.50M | ├──6-3 -Spark Streaming应用场景.mp4 2.06M | ├──6-4 -Spark Streaming集成Spark生态系统的使用.mp4 2.54M | ├──6-5 -Spark Streaming发展史.mp4 1.94M | ├──6-6 -从词频统计功能着手入门Spark Streaming.mp4 45.04M | ├──6-7 -Spark Streaming工作原理(粗粒度).mp4 3.73M | └──6-8 -Spark Streaming工作原理(细粒度).mp4 7.42M ├──第7章 Spark Streaming核心概念与编程 | ├──7-1 -课程目录.mp4 1.07M | ├──7-2 -核心概念之StreamingContext.mp4 49.08M | ├──7-3 -核心概念之DStream.mp4 14.96M | ├──7-4 -核心概念之Input DStreams和Receivers.mp4 29.37M | ├──7-5 -核心概念之Transformation和Output Operations.mp4 20.97M | ├──7-6 -案例实战之Spark Streaming处理socket数据.mp4 75.63M | └──7-7 -案例实战之Spark Streaming处理文件系统数据.mp4 29.17M ├──第8章 Spark Streaming进阶与案例实战 | ├──8-1 -课程目录.mp4 1.56M | ├──8-2 -实战之updateStateByKey算子的使用.mp4 18.82M | ├──8-3 -实战之将统计结果写入到MySQL数据库中.mp4 70.95M | ├──8-4 -实战之窗口函数的使用.mp4 13.69M | ├──8-5 -实战之黑名单过滤.mp4 21.85M | └──8-6 -实战之Spark Streaming整合Spark SQL操作.mp4 35.45M ├──第9章 Spark Streaming整合Flume | ├──9-1 -课程目录.mp4 702.46kb | ├──9-10 -Pull方式整合之本地环境联调.mp4 21.40M | ├──9-11 -Pull方式整合之服务器环境联调.mp4 29.97M | ├──9-2 -Push方式整合之概述.mp4 27.41M | ├──9-3 -Push方式整合之Flume Agent配置开发.mp4 7.84M | ├──9-4 -Push方式整合之Spark Streaming应用开发.mp4 19.09M | ├──9-5 -Push方式整合之本地环境联调.mp4 29.82M | ├──9-6 -Push方式整合之服务器环境联调.mp4 28.33M | ├──9-7 -Pull方式整合之概述.mp4 15.09M | ├──9-8 -Pull方式整合之Flume Agent配置开发.mp4 7.76M | └──9-9 -Pull方式整合之Spark Streaming应用开发.mp4 15.70M ├──第10章 Spark Streaming整合Kafka | ├──10-1 -课程目录.mp4 983.86kb | ├──10-10 -Direct方式整合之服务器环境联调.mp4 22.65M | ├──10-2 -Spark Streaming整合Kafka的版本选择详解.mp4 15.16M | ├──10-3 -Receiver方式整合之概述.mp4 37.94M | ├──10-4 -Receiver方式整合之Kafka测试.mp4 29.88M | ├──10-5 -Receiver方式整合之Spark Streaming应用开发.mp4 36.36M | ├──10-6 -Receiver方式整合之本地环境联调.mp4 16.38M | ├──10-7 -Receiver方式整合之服务器环境联调及Streaming UI讲解.mp4 43.64M | ├──10-8 -Direct方式整合之概述.mp4 59.69M | └──10-9 -Direct方式整合之Spark Streaming应用开发及本地环境测试.mp4 41.07M ├──第11章 Spark Streaming整合Flume&Kafka打造通用流处理基础 | ├──11-1 -课程目录.mp4 1.67M | ├──11-2 -处理流程画图剖析.mp4 4.57M | ├──11-3 -日志产生器开发并结合log4j完成日志的输出.mp4 14.03M | ├──11-4 -使用Flume采集Log4j产生的日志.mp4 58.68M | ├──11-5 -使用KafkaSInk将Flume收集到的数据输出到Kafka.mp4 34.56M | ├──11-6 -Spark Streaming消费Kafka的数据进行统计.mp4 28.03M | └──11-7 -本地测试和生产环境使用的拓展.mp4 14.59M ├──第12章 Spark Streaming项目实战 | ├──12-1 -课程目录.mp4 2.56M | ├──12-10 -对接实时日志数据到Kafka并输出到控制台测试.mp4 39.60M | ├──12-11 -Spark Streaming对接Kafka的数据进行消费.mp4 32.70M | ├──12-12 -使用Spark Streaming完成数据清洗操作.mp4 78.33M | ├──12-13 -功能一之需求分析及存储结果技术选型分析.mp4 20.84M | ├──12-14 -功能一之数据库访问DAO层方法定义.mp4 14.73M | ├──12-15 -功能一之数据库访问DAO层方法实现.mp4 36.31M | ├──12-16 -功能一之HBase操作工具类开发.mp4 55.65M | ├──12-17 -功能一之将Spark Streaming的处理结果写入到HBase中.mp4 45.98M | ├──12-18 -功能二之需求分析及HBase设计&HBase数据访问层开发.mp4 23.77M | ├──12-19 -功能二之功能实现及本地测试.mp4 37.52M | ├──12-2 -需求说明.mp4 7.02M | ├──12-20 -将项目运行在服务器环境中.mp4 154.15M | ├──12-3 -用户行为日志介绍.mp4 19.85M | ├──12-4 -Python日志产生器开发之产生访问url和ip信息.mp4 26.87M | ├──12-5 -Python日志产生器开发之产生referer和状态码信息.mp4 33.55M | ├──12-6 -Python日志产生器开发之产生日志访问时间.mp4 8.92M | ├──12-7 -Python日志产生器服务器测试并将日志写入到文件中.mp4 20.61M | ├──12-8 -通过定时调度工具每一分钟产生一批数据.mp4 21.50M | └──12-9 -使用Flume实时收集日志信息.mp4 30.60M ├──第13章 可视化实战 | ├──13-1 -课程目录.mp4 2.40M | ├──13-10 -实战课程访问量Web层开发.mp4 22.52M | ├──13-11 -实战课程访问量实时查询展示功能实现及扩展.mp4 41.47M | ├──13-12 -Spring Boot项目部署到服务器上运行.mp4 14.94M | ├──13-13 -阿里云DataV数据可视化介绍.mp4 50.38M | ├──13-14 -DataV展示统计结果功能实现.mp4 70.20M | ├──13-2 -为什么需要可视化.mp4 14.06M | ├──13-3 -构建Spring Boot项目.mp4 27.25M | ├──13-4 -Echarts概述.mp4 24.18M | ├──13-5 -Spring Boot整合Echarts绘制静态数据柱状图.mp4 30.57M | ├──13-6 -Spring Boot整合Echarts绘制静态数据饼图.mp4 13.44M | ├──13-7 -项目目录调整.mp4 5.29M | ├──13-8 -根据天来获取HBase表中的实战课程访问次数.mp4 37.49M | └──13-9 -实战课程访问量domain以及dao开发.mp4 19.69M ├──第14章 Java拓展 | ├──14-1 -课程目录.mp4 1012.59kb | ├──14-2 -使用Java开发Spark应用程序.mp4 33.95M | └──14-3 -使用Java开发Spark Streaming应用程序.mp4 45.57M └──project.zip 270.85kb
    • 660
  • 其它
    11-15 04:12
    Spark离线和实时电影推荐系统直播回放(视频+文档+代码) |____十次课-代码调试4.mp4 |____十次课-代码调试3.mp4 |____十次课-代码调试2.mp4 |____十次课-代码调试1.mp4 |____第一次课-数据预处理4.mp4 |____第一次课-数据预处理3.mp4 |____第一次课-数据预处理2.mp4 |____第一次课-数据预处理1.mp4 |____第五次课-产生推荐结果4.mp4 |____第五次课-产生推荐结果3.mp4 |____第五次课-产生推荐结果2.mp4 |____第五次课-产生推荐结果1.mp4 |____第四次课-als和模型参数4.mp4 |____第四次课-als和模型参数3.mp4 |____第四次课-als和模型参数2.mp4 |____第四次课-als和模型参数1.mp4 |____第十一次课-分布式环境运行和调试4.mp4 |____第十一次课-分布式环境运行和调试3.mp4 |____第十一次课-分布式环境运行和调试2.mp4 |____第十一次课-分布式环境运行和调试1.mp4 |____第十二次课-项目总结4.mp4 |____第十二次课-项目总结3.mp4 |____第十二次课-项目总结2.mp4 |____第十二次课-项目总结1.mp4 |____第十二次课-zippelin2.mp4 |____第十二次课-zippelin1.mp4 |____第三次课-数据加工4.mp4 |____第三次课-数据加工3.mp4 |____第三次课-数据加工2.mp4 |____第三次课-数据加工1.mp4 |____第七次课-实时数据加工4.mp4 |____第七次课-实时数据加工3.mp4 |____第七次课-实时数据加工2.mp4 |____第七次课-实时数据加工1.mp4 |____第六次课-数据入库4.mp4 |____第六次课-数据入库3.mp4 |____第六次课-数据入库2.mp4 |____第六次课-数据入库1.mp4 |____第九次课-实时数据接受和ml构建模型的方法4.mp4 |____第九次课-实时数据接受和ml构建模型的方法3.mp4 |____第九次课-实时数据接受和ml构建模型的方法2.mp4 |____第九次课-实时数据接受和ml构建模型的方法1.mp4 |____第二次课-数据清洗8.mp4 |____第二次课-数据清洗7.mp4 |____第二次课-数据清洗6.mp4 |____第二次课-数据清洗5.mp4 |____第八次课-实时数据的接受处理4.mp4 |____第八次课-实时数据的接受处理3.mp4 |____第八次课-实时数据的接受处理2.mp4 |____第八次课-实时数据的接受处理1.mp4 |____spark电影PPT资料.zip |____code.zip
    • 629
  • Spark的体系架构实战和Storm核心技术解读 极客前程SPARK+STORM实战视频教程 非常具备实战意义的课程,需要一定基础才能够完成的进阶学习课程 如果大家想在大数据方面有更深一步的造诣,可以通过这个套课程来提升自己的技术水平 课程目录 (1)spark核心知识讲解;目录中文件数:15个 (4) 03spark的体系结构.mp4 (5) 04伪分布环境搭建.mp4 (6) 05全分布环境的搭建.mp4 (7) 06基于文件目录的恢复.mp4 (8) 07基于zk的高可用集群搭建.mp4 (9) 08使用Spark-Submit递交任务.mp4 (10) 09使用Spark-Shell.mp4 (11) 10分析WordCount的执行过程.mp4 (12) 11开发JAVA版本的WordCount.mp4 (13) 12使用Lambda表达式实现WordCount.mp4 (14) 13使用scala实现WordCount.mp4 (15) pom.xml (16) Spark体系结构.png (17) 蒙特卡罗求PI.png (18) 课程笔记.txt (2)storm详解;目录中文件数:1个 (19) storm大纲.docx (3)精品书籍;目录中文件数:31个 (20) 淘宝技术这十年.pdf (21) 565702+深入理解Hadoop.第2版%40.pdf (22) 581139+深入云计算+Hadoop源代码分析+第2版+%28修订版%29.pdf (23) 581155+Spark大数据实例开发教程.pdf (24) Hadoop入门教程.pdf (25) Hadoop应用开发技术详解-3.pdf (26) Hadoop应用架构.pdf (27) Hadoop技术内幕:深入解析MapReduce架构设计与实现原理.pdf (28) HADOOP权威指南 第3版 PDF电子书下载 带目录书签 完整版.pdf (29) Hadoop权威指南+第3版+修订版+.pdf (30) HADOOP权威指南+第3版+完整版.pdf (31) Hadoop核心技术.pdf (32) HBase权威指南%28中文版%29.pdf (33) HDFS—Hadoop分布式文件系统深度实践.pdf (34) LINUX SHELL脚本攻略(中文版带书签).pdf (35) MapReduce技术流程介绍.pptx (36) MapReduce设计模式+%5B(美).pdf (37) Spark原著中文版.pdf (38) Spark大数据处理:技术、应用与性能优化%28全%29.pdf (39) Spark快速大数据分析.pdf (40) Spark最佳实践+%2C陈欢,林世飞著+ (1).pdf (41) Spark最佳实践+%2C陈欢,林世飞著+.pdf (42) Spark高级数据分析+%28美%29+sandy+ryza%3Buri+laserson%3B++龚少成%28译%29++人民邮电出版社+2015-11-01.pdf (43) Storm分布式实时计算模式.pdf (44) ZooKeeper-分布式过程协同技术详解.pdf (45) ZooKeeper入门简介及配置使用.pdf (46) 《Hadoop技术内幕:深入解析Hadoop+Common和HDFS架构设计与实现原理》.pdf (47) 云计算大数据实战班.pdf (48) 从Paxos到Zookeeper 分布式一致性原理与实践 [倪超著][电子工业出版社][2015.02][422页].pdf (49) 深入理解计算机系统(第二版).pdf (50) 鸟哥的Linux私房菜 基础学习篇(第三版).pdf (4)spark核心知识讲解SparkDemo;目录中文件数:0个 (5)storm详解第一节;目录中文件数:2个 (51) 1 storm概述.mp4 (52) 1 storm概述.pdf (6)storm详解第三节;目录中文件数:2个 (53) 3 第一个storm程序(本地模式).mp4 (54) 3 第一个storm程序(本地模式).pdf (7)storm详解第二节;目录中文件数:2个 (55) 2 storm1.0的安装配置与入门.mp4 (56) 2 storm1.0的安装配置与入门.pdf (8)storm详解第五节;目录中文件数:2个 (57) 5 storm任务分配.mp4 (58) 5 storm任务分配.pdf (9)storm详解第六节;目录中文件数:2个 (59) 6 storm web UI.mp4 (60) 6 storm web UI.pdf (10)storm详解第四节;目录中文件数:2个 (61) 4 storm远程模式.mp4 (62) 4 storm远程模式.pdf (11)spark核心知识讲解SparkDemo.idea;目录中文件数:2个 (63) compiler.xml (64) hydra.xml
    • 602
  • Spark2.x+协同过滤算法,开发企业级个性化推荐系统 完整版 第1章 课程介绍与学习指南 本节主要进行课程的介绍,学习路线与指南,如何更好的学习本课程?为什么要学习本课程,学习本课程具体能收获什么? 第2章 了解推荐系统的生态 本章带你了解推荐系统的生态,让你从思维上重塑对推荐系统的认知。了解推荐系统是由哪些关键元素支撑的,推荐算法的分类以及什么才算一个好的推荐系统 第3章 给学习算法打基础 本章回顾并梳理了学习算法必需的数学知识和统计学知识,帮助大家巩固基础,平滑过渡,为后面学习推荐算法做铺垫。 第4章 详解协同过滤推荐算法原理 本章介绍推荐算法中最常用也最受欢迎的协同过滤推荐算法。首先巩固学习协同过滤特有的数学基础,然后分别从推荐算法的三个类型:基于用户,基于物品,基于模型来展开,并且对它们进行代码演示。 第5章 基于Spark的协同过滤原理 本章讲解Spark内置的推荐算法:ALS。从算法原理、Spark上实现、源码阅读,这3个方面全面讲解ALS算法。 第6章 推荐系统搭建——需求分析和环境搭建 开始进行推荐系统的实操了!大家准备好了吗?这章我们进行对整个推荐系统做一个需求分析。并且手把手带领环境搭建。 第7章 推荐系统搭建——UI界面模块 先从简单内容起步,一般大数据开发工程师主要负责数据的收集和分析,这里为了演示方便我们制作了简单的前端页面,使用了 VUE、Element-UI和EChatrs 第8章 推荐系统搭建——数据层 做好前期准备,终于步入正轨了,大家是不是都按耐不住了?本章将带领大家开发项目的数据层的部分,分别实现数据采集、清洗、分析等功能。 第9章 推荐系统搭建——推荐引擎 本章将要介绍本次项目的重难点,推荐引擎模块的搭建。主要讲解推荐模块的几个核心:召回,过滤,特征计算和排序。逐步完成实时推荐架构的搭建。 第10章 推荐系统搭建——推荐结果存储 本章演示个性化推荐系统的评估模块的搭建。主要是介绍主流的测试模块A/B测试,逐步开发搭建一个完整的A/B测试后台 第11章 推荐系统搭建——推荐效果评估模块 本章演示个性化推荐系统收尾环节,评估模块的搭建。主要介绍主流的测试模块A/BTest,逐步搭建一个完整的A/B测试后台 第12章 知识拓展——基于关联规则的推荐算法 本章讲解两个主要的关联规则推荐算法,Apriori和FP-Growth,并通过Spark去演示这两个算法的实现。 第13章 知识拓展——基于机器学习的推荐算法 本章主要讲解主流的基于机器学习的推荐算法。首先介绍RBM随机网络原理,接着分别展示基于 RBN、CNN、RNN的推荐算法,演示如何实现。 第14章 知识拓展——基于内容的推荐算法 本章主要介绍主流的基于内容的推荐算法,分别介绍TF-IDF算法、文本向量化、用户行为向量化和长期模型。最后对所有算法知识以及课程项目进行一个总结和展望。
    • 500
  • 其它
    01-23 03:01
    Spark与Spark Streaming核心架构系统实践课程 Spark Streaming实时流处理项目实战 Spark Streaming是Spark core API的扩展,支持实时数据流的处理,并且具有可扩展,高吞吐量,容错的特点 Spark Streaming用于处理流式计算问题,能够和Spark的其他模块无缝集成。 Spark Streaming接收实时输入数据流并将数据分成批,然后由Spark引擎处理,以批量生成最终结果流。 这套课程直接从项目开始讲起,不适合零基础学习的同学,但是对需要深入学习Spark的同学来说是不可多得的好课程! 课程目录 (0)配套资料; (1) Linux.rar (2) project.zip (1)第10章 Spark Streaming整合Kafka;目录中文件数:10个 (3) 10-1 -课程目录.mp4 (4) 10-10 -Direct方式整合之服务器环境联调.mp4 (5) 10-2 -Spark Streaming整合Kafka的版本选择详解.mp4 (6) 10-3 -Receiver方式整合之概述.mp4 (7) 10-4 -Receiver方式整合之Kafka测试.mp4 (8) 10-5 -Receiver方式整合之Spark Streaming应用开发.mp4 (9) 10-6 -Receiver方式整合之本地环境联调.mp4 (10) 10-7 -Receiver方式整合之服务器环境联调及Streaming UI讲解.mp4 (11) 10-8 -Direct方式整合之概述.mp4 (12) 10-9 -Direct方式整合之Spark Streaming应用开发及本地环境测试.mp4 (2)第11章 Spark Streaming整合Flume&Kafka打造通用流处理基础;目录中文件数:7个 (13) 11-1 -课程目录.mp4 (14) 11-2 -处理流程画图剖析.mp4 (15) 11-3 -日志产生器开发并结合log4j完成日志的输出.mp4 (16) 11-4 -使用Flume采集Log4j产生的日志.mp4 (17) 11-5 -使用KafkaSInk将Flume收集到的数据输出到Kafka.mp4 (18) 11-6 -Spark Streaming消费Kafka的数据进行统计.mp4 (19) 11-7 -本地测试和生产环境使用的拓展.mp4 (3)第12章 Spark Streaming项目实战;目录中文件数:20个 (20) 12-1 -课程目录.mp4 (21) 12-10 -对接实时日志数据到Kafka并输出到控制台测试.mp4 (22) 12-11 -Spark Streaming对接Kafka的数据进行消费.mp4 (23) 12-12 -使用Spark Streaming完成数据清洗操作.mp4 (24) 12-13 -功能一之需求分析及存储结果技术选型分析.mp4 (25) 12-14 -功能一之数据库访问DAO层方法定义.mp4 (26) 12-15 -功能一之数据库访问DAO层方法实现.mp4 (27) 12-16 -功能一之HBase操作工具类开发.mp4 (28) 12-17 -功能一之将Spark Streaming的处理结果写入到HBase中.mp4 (29) 12-18 -功能二之需求分析及HBase设计&HBase数据访问层开发.mp4 (30) 12-19 -功能二之功能实现及本地测试.mp4 (31) 12-2 -需求说明.mp4 (32) 12-20 -将项目运行在服务器环境中.mp4 (33) 12-3 -用户行为日志介绍.mp4 (34) 12-4 -Python日志产生器开发之产生访问url和ip信息.mp4 (35) 12-5 -Python日志产生器开发之产生referer和状态码信息.mp4 (36) 12-6 -Python日志产生器开发之产生日志访问时间.mp4 (37) 12-7 -Python日志产生器服务器测试并将日志写入到文件中.mp4 (38) 12-8 -通过定时调度工具每一分钟产生一批数据.mp4 (39) 12-9 -使用Flume实时收集日志信息.mp4 (4)第13章 可视化实战;目录中文件数:14个 (40) 13-1 -课程目录.mp4 (41) 13-10 -实战课程访问量Web层开发.mp4 (42) 13-11 -实战课程访问量实时查询展示功能实现及扩展.mp4 (43) 13-12 -Spring Boot项目部署到服务器上运行.mp4 (44) 13-13 -阿里云DataV数据可视化介绍.mp4 (45) 13-14 -DataV展示统计结果功能实现.mp4 (46) 13-2 -为什么需要可视化.mp4 (47) 13-3 -构建Spring Boot项目.mp4 (48) 13-4 -Echarts概述.mp4 (49) 13-5 -Spring Boot整合Echarts绘制静态数据柱状图.mp4 (50) 13-6 -Spring Boot整合Echarts绘制静态数据饼图.mp4 (51) 13-7 -项目目录调整.mp4 (52) 13-8 -根据天来获取HBase表中的实战课程访问次数.mp4 (53) 13-9 -实战课程访问量domain以及dao开发.mp4 (5)第14章 Java拓展;目录中文件数:3个 (54) 14-1 -课程目录.mp4 (55) 14-2 -使用Java开发Spark应用程序.mp4 (56) 14-3 -使用Java开发Spark Streaming应用程序.mp4 (6)第1章 课程介绍;目录中文件数:5个 (57) 1-1 -导学-.mp4 (58) 1-2 -授课习惯和学习建议.mp4 (59) 1-3 -OOTB环境使用演示.mp4 (60) 1-4 -Linux环境及软件版本介绍.mp4 (61) 1-5 -Spark版本升级.mp4 (7)第2章 初识实时流处理;目录中文件数:8个 (62) 2-1 -课程目录.mp4 (63) 2-2 -业务现状分析.mp4 (64) 2-3 -实时流处理产生背景.mp4 (65) 2-4 -实时流处理概述.mp4 (66) 2-5 -离线计算和实时计算对比.mp4 (67) 2-6 -实时流处理框架对比.mp4 (68) 2-7 -实时流处理架构及技术选型.mp4 (69) 2-8 -实时流处理在企业中的应用.mp4 (8)第3章 分布式日志收集框架Flume;目录中文件数:8个 (70) 3-1 -课程目录.mp4 (71) 3-2 -业务现状分析.mp4 (72) 3-3 -Flume概述.mp4 (73) 3-4 -Flume架构及核心组件.mp4 (74) 3-5 -Flume&JDK环境部署.mp4 (75) 3-6 -Flume实战案例一.mp4 (76) 3-7 -Flume实战案例二.mp4 (77) 3-8 -Flume实战案例三(重点掌握).mp4 (9)第4章 分布式发布订阅消息系统Kafka;目录中文件数:11个 (78) 4-1 -课程目录.mp4 (79) 4-10 -Kafka Consumer Java API编程.mp4 (80) 4-11 -Kafka实战之整合Flume和Kafka完成实时数据采集.mp4 (81) 4-2 -Kafka概述.mp4 (82) 4-3 -Kafka架构及核心概念.mp4 (83) 4-4 -Kafka单节点单Broker部署之Zookeeper安装.mp4 (84) 4-5 -Kafka单节点单broker的部署及使用.mp4 (85) 4-6 -Kafka单节点多broker部署及使用.mp4 (86) 4-7 -Kafka容错性测试.mp4 (87) 4-8 -使用IDEA+Maven构建开发环境.mp4 (88) 4-9 -Kafka Producer Java API编程.mp4 (10)第5章 实战环境搭建;目录中文件数:7个 (89) 5-1 -课程目录.mp4 (90) 5-2 -Scala安装.mp4 (91) 5-3 -Maven安装.mp4 (92) 5-4 -Hadoop环境搭建.mp4 (93) 5-5 -HBase安装.mp4 (94) 5-6 -Spark环境搭建.mp4 (95) 5-7 -开发环境搭建.mp4 (11)第6章 Spark Streaming入门;目录中文件数:8个 (96) 6-1 -课程目录.mp4 (97) 6-2 -Spark Streaming概述.mp4 (98) 6-3 -Spark Streaming应用场景.mp4 (99) 6-4 -Spark Streaming集成Spark生态系统的使用.mp4 (100) 6-5 -Spark Streaming发展史.mp4 (101) 6-6 -从词频统计功能着手入门Spark Streaming.mp4 (102) 6-7 -Spark Streaming工作原理(粗粒度).mp4 (103) 6-8 -Spark Streaming工作原理(细粒度).mp4 (12)第7章 Spark Streaming核心概念与编程;目录中文件数:7个 (104) 7-1 -课程目录.mp4 (105) 7-2 -核心概念之StreamingContext.mp4 (106) 7-3 -核心概念之DStream.mp4 (107) 7-4 -核心概念之Input DStreams和Receivers.mp4 (108) 7-5 -核心概念之Transformation和Output Operations.mp4 (109) 7-6 -案例实战之Spark Streaming处理socket数据.mp4 (110) 7-7 -案例实战之Spark Streaming处理文件系统数据.mp4 (13)第8章 Spark Streaming进阶与案例实战;目录中文件数:6个 (111) 8-1 -课程目录.mp4 (112) 8-2 -实战之updateStateByKey算子的使用.mp4 (113) 8-3 -实战之将统计结果写入到MySQL数据库中.mp4 (114) 8-4 -实战之窗口函数的使用.mp4 (115) 8-5 -实战之黑名单过滤.mp4 (116) 8-6 -实战之Spark Streaming整合Spark SQL操作.mp4 (14)第9章 Spark Streaming整合Flume;目录中文件数:11个 (117) 9-1 -课程目录.mp4 (118) 9-10 -Pull方式整合之本地环境联调.mp4 (119) 9-11 -Pull方式整合之服务器环境联调.mp4 (120) 9-2 -Push方式整合之概述.mp4 (121) 9-3 -Push方式整合之Flume Agent配置开发.mp4 (122) 9-4 -Push方式整合之Spark Streaming应用开发.mp4 (123) 9-5 -Push方式整合之本地环境联调.mp4 (124) 9-6 -Push方式整合之服务器环境联调.mp4 (125) 9-7 -Pull方式整合之概述.mp4 (126) 9-8 -Pull方式整合之Flume Agent配置开发.mp4 (127) 9-9 -Pull方式整合之Spark Streaming应用开发.mp4
    • 499
  • 其它
    02-16 10:22
    Spark亚太研究院-Spark实战高手之路:从零开始 |____Spark实战高手之路(5):构建Spark集群.pdf |____Spark实战高手之路(4):构建Spark集群.pdf |____Spark实战高手之路(3):构造分布式Spark集群.pdf |____Spark实战高手之路(2):如何构建真正的Hadoop分布式集群环境.pdf |____Spark实战高手之路(1):如何搭建Spark集群.pdf |____Spark实战高手之路-第6章Spark SQL编程动手实战(1).pdf |____Spark实战高手之路-第5章Spark API编程动手实战(4).pdf |____Spark实战高手之路-第5章Spark API编程动手实战(3).pdf |____Spark实战高手之路-第5章Spark API编程动手实战(2).pdf |____Spark实战高手之路-第5章Spark API编程动手实战(1).pdf |____Spark实战高手之路-第4章Spark内核揭秘(5).pdf |____Spark实战高手之路-第4章Spark内核揭秘(4).pdf |____Spark实战高手之路-第4章Spark内核揭秘(3).pdf |____Spark实战高手之路-第4章Spark内核揭秘(2).pdf |____Spark实战高手之路-第4章Spark内核揭秘(1):Spark内核初探.pdf |____Spark实战高手之路-第3章Spark架构设计与编程模型(4).pdf |____Spark实战高手之路-第3章Spark架构设计与编程模型(3).pdf |____Spark实战高手之路-第3章Spark架构设计与编程模型(2).pdf |____Spark实战高手之路-第3章Spark架构设计与编程(1).pdf |____Spark实战高手之路-第2章动手实战Scala(3).pdf |____Spark实战高手之路-第2章动手实战Scala(2).pdf |____Spark实战高手之路-第2章动手实战Scala(1).pdf
    • 420
  • 其它
    08-04 06:49
    Spark机器学习班 第一阶段 Spark基础入门 第1课 Spark系统概述与编程接口 知识点1:Spark系统概述 知识点2:Spark RDD分区及依赖关系 知识点3:RDD API-transformation、action 实战项目:PageRank中的依赖关系 第2课 Spark运行模式及原理 知识点1:Spark运行模式 知识点2:Spark基本工作流程 知识点3:Spark Shuffle讲解 实战项目:YARN cluster模式–部署、运行、内部实现及其原理 第二阶段 Spark进阶:存储、调度、性能调优 第3课 Spark存储、调度、与监控分析 知识点1:存储管理模块整体架构 知识点2:RDD持久化 知识点3:Shuffle数据持久化 知识点4:广播(Broadcast)变量持久化 知识点5:Spark调度相关流程 实战项目:Spark监控管理 第4课 Spark性能调优 知识点1:开发调优 知识点2:资源调优 知识点3:数据倾斜调优 实战项目:shuffle调优 第三阶段 Spark深入:即时查询、流计算与图计算 第5课 Spark即时查询讲解 知识点1:SQLContext 及DataFrame的介绍 知识点2:常用的查询操作 知识点3:流计算系统的对比 知识点4:Spark streaming的介绍与数据处理流程 知识点5:流数据源的接入 知识点6:transformation与window操作 实战项目:SQL优化配置、及流计算项目的部署与调优 第6课 Spark图计算讲解 知识点1:属性图的介绍 知识点2:edge、vertex、triplet介绍与创建 知识点3:属性图的操作 知识点4:图算法介绍 实战项目:图的调优 第四阶段 Spark机器学习实战 第7课 Spark机器学习讲解 知识点1:Mllib 机器学习库介绍 知识点2:基本的统计分析功能 知识点3:基本的机器学习库使用介绍 知识点4:模型的评价标准库使用介绍 实战项目:使用逻辑回归完成KDD99的分类问题 第8课 Spark机器学习应用 实战项目:使用Mllib的树模型完成分类问题 实战项目:使用Mllib搭建推荐系统
    • 401